智能论文笔记

Sustainable AI Processing at the Edge

Sébastien Ollivier , Sheng Li , Yue Tang , Chayanika Chaudhuri , Peipei Zhou , Xulong Tang , Jingtong Hu , Alex K. Jones

分类：人工智能

2022-07-04

边缘计算是加速机器学习算法支持移动设备的流行目标，而无需通信潜伏在云中处理它们。机器学习的边缘部署主要考虑传统问题，例如其安装的交换约束（尺寸，重量和功率）。但是，考虑到体现能量和碳的重要贡献，这种指标不足以考虑计算的环境影响。在本文中，我们探讨了用于推理和在线培训的卷积神经网络加速引擎的权衡。特别是，我们探讨了内存处理（PIM）方法，移动GPU加速器以及最近发布的FPGA的使用，并将它们与新颖的赛车记忆PIM进行比较。用赛车记忆PIM替换支持PIM的DDR3可以恢复其体现的能量，以至于1年。对于高活动比，与支持PIM的赛车记忆相比，移动GPU可以更可持续，但具有更高的体现能量可以克服。

translated by 谷歌翻译

Brain-inspired Cognition in Next Generation Racetrack Memories

Asif Ali Khan , Sebastien Ollivier , Stephen Longofono , Gerald Hempel , Jeronimo Castrillon , Alex K. Jones

分类：机器学习

2021-11-03

超比计算（HDC）是由大脑启发的新出现的计算框架，其在数千个尺寸上运行以模拟认知的载体。与运行数量的传统计算框架不同，HDC，如大脑，使用高维随机向量并能够一次学习。 HDC基于明确定义的算术运算集，并且是高度误差的。 HDC的核心运营操纵高清vectors以散装比特方式，提供许多机会利用并行性。遗憾的是，在传统的von-neuman架构上，处理器中的高清矢量的连续运动可以使认知任务过度缓慢和能量密集。硬件加速器只会略微改进相关的指标。相反，只有使用新兴铭文设备内存的HDC框架的部分实施，已报告了相当大的性能/能源收益。本文介绍了一种基于赛道内存（RTM）的架构，以便在内存中进行和加速整个HDC框架。所提出的解决方案需要最小的附加CMOS电路，并在称为横向读取（TR）的RTM中跨多个域的读取操作，以实现排他性或（XOR）和添加操作。为了最小化CMOS电路的开销，我们提出了一种基于RTM纳米线的计数机制，其利用TR操作和标准RTM操作。使用语言识别作为用例，分别与FPGA设计相比，整体运行时和能耗降低了7.8倍和5.3倍。与最先进的内存实现相比，所提出的HDC系统将能耗降低8.6倍。

translated by 谷歌翻译

Skeletal Video Anomaly Detection using Deep Learning: Survey, Challenges and Future Directions

Pratik K. Mishra , Alex Mihailidis , Shehroz S. Khan

分类：计算机视觉

2022-12-31

The existing methods for video anomaly detection mostly utilize videos containing identifiable facial and appearance-based features. The use of videos with identifiable faces raises privacy concerns, especially when used in a hospital or community-based setting. Appearance-based features can also be sensitive to pixel-based noise, straining the anomaly detection methods to model the changes in the background and making it difficult to focus on the actions of humans in the foreground. Structural information in the form of skeletons describing the human motion in the videos is privacy-protecting and can overcome some of the problems posed by appearance-based features. In this paper, we present a survey of privacy-protecting deep learning anomaly detection methods using skeletons extracted from videos. We present a novel taxonomy of algorithms based on the various learning approaches. We conclude that skeleton-based approaches for anomaly detection can be a plausible privacy-protecting alternative for video anomaly detection. Lastly, we identify major open research questions and provide guidelines to address them.

translated by 谷歌翻译

Privacy-Protecting Behaviours of Risk Detection in People with Dementia using Videos

Pratik K. Mishra , Andrea Iaboni , Bing Ye , Kristine Newman , Alex Mihailidis , Shehroz S. Khan

分类：计算机视觉

2022-12-20

People living with dementia often exhibit behavioural and psychological symptoms of dementia that can put their and others' safety at risk. Existing video surveillance systems in long-term care facilities can be used to monitor such behaviours of risk to alert the staff to prevent potential injuries or death in some cases. However, these behaviours of risk events are heterogeneous and infrequent in comparison to normal events. Moreover, analyzing raw videos can also raise privacy concerns. In this paper, we present two novel privacy-protecting video-based anomaly detection approaches to detect behaviours of risks in people with dementia. We either extracted body pose information as skeletons and use semantic segmentation masks to replace multiple humans in the scene with their semantic boundaries. Our work differs from most existing approaches for video anomaly detection that focus on appearance-based features, which can put the privacy of a person at risk and is also susceptible to pixel-based noise, including illumination and viewing direction. We used anonymized videos of normal activities to train customized spatio-temporal convolutional autoencoders and identify behaviours of risk as anomalies. We show our results on a real-world study conducted in a dementia care unit with patients with dementia, containing approximately 21 hours of normal activities data for training and 9 hours of data containing normal and behaviours of risk events for testing. We compared our approaches with the original RGB videos and obtained an equivalent area under the receiver operating characteristic curve performance of 0.807 for the skeleton-based approach and 0.823 for the segmentation mask-based approach. This is one of the first studies to incorporate privacy for the detection of behaviours of risks in people with dementia.

translated by 谷歌翻译

Deep Labeling of fMRI Brain Networks Using Cloud Based Processing

Sejal Ghate , Alberto Santa-Maria Pang , Ivan Tarapov , Haris I Sair , Craig K Jones

分类：机器学习

2022-09-16

静止状态fMRI是一种成像方式，它通过信号变化揭示了大脑活动的定位，这就是所谓的静息状态网络（RSN）。该技术正在在神经外科预制范围内广受欢迎，以可视化功能区域并评估区域活动。 RS-FMRI网络的标签需要主题的专业知识并且耗时，因此需要自动分类算法。尽管AI在医学诊断中的影响表现出了很大的进步。在临床环境中部署和维护它们是未满足的需求。我们提出了一条端到端可重复的管道，该管道将RS-FMRI的图像处理结合在基于云的工作流程中，同时使用深度学习来自动化RSN的分类。我们已经构建了可重现的Azure机器学习基于云的医学成像概念管道，用于fMRI分析，集成了流行的FMRIB软件库（FSL）工具包。为了证明使用大型数据集的临床应用，我们比较了三个神经网络体系结构，以分类从处理后的RS-FMRI中得出的更深型RSN。这三种算法是：MLP，基于2D投影的CNN和一个完全3D CNN分类网络。每种网络都在RS-FMRI背面项目的独立组件上训练，每种分类方法的精度> 98％。

translated by 谷歌翻译

Cross-Modal Knowledge Transfer Without Task-Relevant Source Data

Sk Miraj Ahmed , Suhas Lohit , Kuan-Chuan Peng , Michael J. Jones , Amit K. Roy-Chowdhury

分类：计算机视觉

2022-09-08

现在，具有成本效益的深度和红外传感器作为常规RGB传感器的替代方案已成为现实，并且在自主导航和遥控传感等域中具有比RGB的优势。因此，建立计算机视觉和深度学习系统以进行深度和红外数据至关重要。但是，仍然缺乏针对这些模式的大型标签数据集。在这种情况下，将知识从源模式（RGB）的良好标记的大型数据集训练的神经网络转移到在目标模式（深度，红外等）上工作的神经网络具有很大价值。出于内存和隐私等原因，可能无法访问源数据，并且知识转移需要仅与源模型一起使用。我们描述了一个有效的解决方案，插座：无源的跨模式知识转移，用于将知识从一个源模式转移到不同目标模式的具有挑战性的任务，而无需访问与任务相关的源数据。该框架使用配对的任务 - IRRELELERVANT数据以及将目标特征的平均值和方差与源模型中存在的批处理统计信息匹配，从而减少了模态差距。我们通过广泛的实验表明，我们的方法明显优于无法解释模式差距的分类任务的现有无源方法。

translated by 谷歌翻译

Graph Neural Networks for Low-Energy Event Classification & Reconstruction in IceCube

R. Abbasi , M. Ackermann , J. Adams , N. Aggarwal , J. A. Aguilar , M. Ahlers , M. Ahrens , J. M. Alameddine , A. A. Alves Jr. , N. M. Amin

分类：机器学习

2022-09-07

ICECUBE是一种用于检测1 GEV和1 PEV之间大气和天体中微子的光学传感器的立方公斤阵列，该阵列已部署1.45 km至2.45 km的南极的冰盖表面以下1.45 km至2.45 km。来自ICE探测器的事件的分类和重建在ICeCube数据分析中起着核心作用。重建和分类事件是一个挑战，这是由于探测器的几何形状，不均匀的散射和冰中光的吸收，并且低于100 GEV的光，每个事件产生的信号光子数量相对较少。为了应对这一挑战，可以将ICECUBE事件表示为点云图形，并将图形神经网络（GNN）作为分类和重建方法。 GNN能够将中微子事件与宇宙射线背景区分开，对不同的中微子事件类型进行分类，并重建沉积的能量，方向和相互作用顶点。基于仿真，我们提供了1-100 GEV能量范围的比较与当前ICECUBE分析中使用的当前最新最大似然技术，包括已知系统不确定性的影响。对于中微子事件分类，与当前的IceCube方法相比，GNN以固定的假阳性速率（FPR）提高了信号效率的18％。另外，GNN在固定信号效率下将FPR的降低超过8（低于半百分比）。对于能源，方向和相互作用顶点的重建，与当前最大似然技术相比，分辨率平均提高了13％-20％。当在GPU上运行时，GNN能够以几乎是2.7 kHz的中位数ICECUBE触发速率的速率处理ICECUBE事件，这打开了在在线搜索瞬态事件中使用低能量中微子的可能性。

translated by 谷歌翻译

Semi-Supervised Disentanglement of Tactile Contact~Geometry from Sliding-Induced Shear

Anupam K. Gupta , Alex Church , Nathan F. Lepora

分类：机器人 | 人工智能

2022-08-26

触觉是人类敏捷的基础。当模仿机器人触摸（尤其是使用软光学触觉传感器）时，由于运动依赖性剪切而遭受失真。这使触觉任务复杂化，例如形状重建和探索，需要有关接触几何的信息。在这项工作中，我们采用半监督的方法来删除剪切，同时保留仅接触信息。我们通过显示模型生成的未切除图像与它们的对应物之间的匹配来验证我们的方法。模型生成的未切除图像给出了忠实的接触几何形状的重建，否则将剪切掩盖，以及对物体姿势的强大估计，然后用于滑动探索和对几种平面形状的全面重建。我们表明，我们的半监督方法的性能与在所有验证任务中的全面监督对等方面的性能相当，而监督的监督较少。因此，半监督方法更加计算和标记样品效率。我们预计，它将对通过剪切敏感的触觉执行的各种复杂触觉探索和操纵任务具有广泛的适用性。

translated by 谷歌翻译

HTML版本

Clustering Egocentric Images in Passive Dietary Monitoring with Self-Supervised Learning

Jiachuan Peng , Peilun Shi , Jianing Qiu , Xinwei Ju , Frank P. -W. Lo , Xiao Gu , Wenyan Jia , Tom Baranowski , Matilda Steiner-Asiedu , Alex K. Anderson

分类：计算机视觉

2022-08-25

在我们最近在加纳被动饮食监测的饮食评估现场研究中，我们收集了超过25万件野外图像。该数据集是一种持续的努力，旨在通过被动监控摄像头技术在低收入和中等收入国家中准确测量单个食物和营养摄入量。目前的数据集涉及加纳农村地区和城市地区的20个家庭（74个受试者），研究中使用了两种不同类型的可穿戴摄像机。一旦开始，可穿戴摄像机会不断捕获受试者的活动，该活动会产生大量的数据，以便在进行分析之前清洁和注释。为了简化数据后处理和注释任务，我们提出了一个新颖的自学学习框架，以将大量以自我为中心的图像聚集到单独的事件中。每个事件都由一系列时间连续和上下文相似的图像组成。通过将图像聚集到单独的事件中，注释者和营养师可以更有效地检查和分析数据，并促进随后的饮食评估过程。在带有地面真实标签的固定测试套装上验证，拟议的框架在聚集质量和分类准确性方面优于基准。

translated by 谷歌翻译

Lossy compression of multidimensional medical images using sinusoidal activation networks: an evaluation study

Matteo Mancini , Derek K. Jones , Marco Palombo

分类：计算机视觉 | 机器学习

2022-08-02

在这项工作中，我们评估了如何利用具有周期性激活功能的神经网络可靠地压缩大型多维医学图像数据集，并将概念验证应用应用于4D扩散加权MRI（DMRI）。在医学成像景观中，多维MRI是开发对基础组织微观结构既敏感又具有特异性的生物标志物的关键研究领域。但是，这些数据的高维质在存储和共享功能和相关成本方面构成了挑战，需要适当的算法能够在低维空间中表示信息。深度学习中的最新理论发展表明了周期性激活函数如何成为隐式神经表示图像的强大工具，并且可以用于压缩2D图像。在这里，我们将此方法扩展到4D图像，并展示如何通过正弦激活网络的参数准确地表示任何给定的4D DMRI数据集，从而达到数据压缩率是标准放气算法的10倍。我们的结果表明，所提出的方法优于基准relu和tanh激活感知到均方根误差，峰值信噪比和结构相似性指数。随后使用张量和球形谐波表示的随后分析表明，所提出的损耗压缩可准确再现原始数据的特征，从而导致相对误差约5至10倍，比基准JPEG2000有损耗压缩低约5至10倍，与标准预处理步骤相似，例如MP-PCA表示，表明在当前接受的临床应用水平内丧失信息。

translated by 谷歌翻译